小米继2月开源VLA大模型Xiaomi-Robotics-0后,近日公布其真机后训练全流程,旨在解决机器人从实验室到实际生产的“最后一公里”问题。演示中,搭载该模型的机器人仅用20小时训练便展现出精细操作能力,推动AI机器人成为开箱即用的生产力工具。
小米开源47亿参数机器人模型Xiaomi-Robotics-0,采用MoT混合架构,通过“大脑”与“小脑”协同工作,在消费级显卡上实现实时推理,解决现有VLA模型因推理延迟导致动作迟缓的问题,提升机器人控制效率与泛化能力。
小米开源全新多模态大模型Xiaomi MiMo-VL-7B-2508,包含SFT和RL两个版本。新版本优化了输出模式,提升RL训练稳定性,在MMMU、ChartQA等多项评测中取得突破性进步。模型创新性地支持"思考模式"和"非思考模式"切换,前者展示完整推理过程,后者响应更快。在小米内部VLM Arena评分达1131.2分,全面超越前代版本,在同类开源模型中保持领先优势。
小米大模型团队宣布开源最新一代多模态大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。 官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四项核心能力上全面刷新纪录,其中 MMMU 基准首次突破70分大关,ChartQA 升至94.4,ScreenSpot-v2达92.5,VideoMME 提升至70.8。
Alibaba
$1
输入tokens/百万
$10
输出tokens/百万
256
上下文长度
$2
$20
-
$0.8
128
Baidu
32
Bytedance
$8
Deepseek
$4
$12
$1.6
Tencent
24
$0.5
$3
$9
16